Идея

Я выбрала базу данных клиентов Оператора универсальных услуг связи. В этой базе так же отмечено, ушел ли клиент от этого оператора или остался.

Идеей моего проекта было понять, почему клиенты уходят и как это предотвратить, как исправить ситуацию.

Обзор

Сначала я решила посмотреть, с какими данными я работаю и как соотносятся разные величины для оставшихся и ушедших клиентов.

Первым параметром было Количество ушедших и оставшихся клиентов.

Большее количество клиентов остаются в кампании, но 26.6 процентов все-таки уходят

Далее я разделила всех клиентов на оставшихся и ушедших и смотрела по разным категориям.

Гендерное распределение клиентов:

Является ли клиент пожилым или нет

Есть ли у клиента партнер или нет

Есть ли у клиента иждевенцы или нет

Есть ли у клиента телефонный сервис или нет

Есть ли у клиента несколько линий или нет

Интернет-провайдер клиента

Есть ли у клиента онлайн-безопасность или нет

Есть ли у клиента онлайн-резервное копирование или нет

Есть ли у клиента защита устройства или нет

Есть ли у клиента техническая поддержка или нет

Есть ли у клиента потоковое телевидение и фильмы или нет

Срок договора заказчика

Есть ли у клиента безбумажный счет или нет

Способ оплаты клиента

Наиболее популярными услугами оказались телефон, просмотр телевизора и фильмов

Надо обратить внимание на то, что если у человека не подключен интернет, то он не пользуется остальными услугами либо без интернета он не может ими пользоваться.

Пожилые клиенты

Пожилых людей не так много, но

Большая доля пенсионеров уходит

Посмотрим, почему они могут уходить.

Во-первых, посмотрим, какими услугами они пользуются:

Оказалось, что большинство пожилых людей, которые ушли из кампании, использовали телевидение и смотрели фильмы.

Вывод

Можно сделать вывод о том, что люди пожилого возраста уходят из кампании, потому что они в основном смотрят телевизор и фильм и интернет им не нужен и они не хотят тратить деньги на лишние услуги.

Для решения проблемы можно:

Cпособ оплаты

У оставшихся клиентов все виды оплат распределились одинаковым образом (примерно 25%)

Сервис с оплатой по электронному чеку имеет наибольший отток. Клиетам может не нравится сервис с опатой по электоронному чеку, хначит они уходят из кампании

Вывод

Чтобы избавиться от проблемы необходимо улучшить сервис с оплатой по электронному чеку.

Период пребывания в кампании и расходы

Зависят друг от друга: Срок пребывания и Общая сумма платежей

Не зависят: ежемесячный платеж и общая сумма платежа

Чтобы лучше понять, как соотносятся величины, потроим точечную диаграмму.

Зависимость всей суммы платежей от срока пребывания

Зависимость всей суммы платежей от ежемесечного платежа

Зависимость ежемесячного платежа от срока пребывания

Отток пользователей в разрезе количества месяцев

Среднемесячные расходы по группам срока пребывания

Средние общие расходы по группам срока пребывания

Распределение по сроку пребывания

Распределение по ежемесячным платежам

Распределение по общему колличесву платежей

Посмотрим, какими услугами польщовались клиенты с высокой оплатой:

Посмотрим, какими услугами пользовались клиенты с высокой оплатой, котопые все-таки ушли из кампании:

Как и для пожилых людей получилось, что самыми популярными услунами оказались телевидение и фильмы и телефон.

Вывод

Надо улучшать сервис с телевидением и фильмами.

Длительность договора

Вывод

Надо лучше продвигать годовые и особенно 2-х летние контракты, чтобы больше людей преобретали их и дольше оставались в кампании.

Проверим эту гипотезу:

На сколько люди оставались после заключения каждого вида договора:

Проверим с помощью ку-ку плота, насколько распределения нормальные

Проверим с помощью критерия Шапиро-Уилка

Распределение не нормальное. Используем критерий сравнения Манна-Уитни.

Из двух выборок получим одну,отсортируем и затем расставим ранги. Максимальное значение в группе имеет первый ранг и так далее.

Дальше необходимо вычислить сумму рангов

Вывод

Получаем, что есть статистически значимая разница между

Интернет соединение

Видно, что большинство людей, которые ушли из кампании пользовались оптоволоконным соединением.

Проверим гипотезу

Проверим гипотезу о том, что доли для разных линий связи различаются.

Критерий Хи-квадарт позволяет нам сравнить отношения количества успеха к неуспехам в двух таблицах.

Вывод

Не можем принять нулевую гипотезу о том, что доли не имеют значимого различия.

Тип соединения влияет на отток.

Выводы